D2GRs2 样本

Pasted image 20240707151825.png

符号 描述
Ψk(tj) 特征日志系统在时间tj的第k个训练样本(k是全局排序的)

在DLRMs中,在用户交互(ai 点击,分享,正负反馈都有)过一些内容Φi 之后,元组(内容Φi,动作ai)加上特征日志系统的特征(categorical, numerical) 构成最终样本。

在GRs中,使用的样本量级比DLRMs低1-2量级。
nc(nc,i) 第i条样本对应的用户历史交互的content序列的长度
Φ0,...,Φnc1 用户在推荐上下文中交互的内容列表
a0,...,anc1 用户对同一个content 可能产生多种行为,如果是binary的行为,那么可以用multi-hot vector来表示,比如用户点了1个content,随后又产生了点赞/收藏等,那么每个ai 就是有多个位置为1的multi-hot vector。
E,F DLRM中的分类特征,例如,最近10张用户喜欢的图片、与当前候选内容相比过去用户点击过的50个最相似的网址等。

“merge & sequentialize” denotes the (virtual) reverse process of obtaining the raw engagement series
G,H DLRM中的分类特征,与用户-内容交互无关。这些特征(例如,人口统计(年龄段、地区)或关注的创作者)被合并到主时间序列中